home *** CD-ROM | disk | FTP | other *** search
/ Fritz: All Fritz / All Fritz.zip / All Fritz / FILES / UTILREEN / PROCR.LZH / MANUAL.DOC < prev    next >
Text File  |  1990-01-15  |  19KB  |  469 lines

  1.  
  2.       PROFESSIONAL OPTICAL CHARACTER RECOGNITION   -   PRO-CR<tm>
  3.       ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
  4.  
  5.         Copyright 1989, David P. Gray, Gray Design Associates
  6.                 All Rights Reserved
  7.  
  8.         Member, Association of Shareware Professionals
  9.  
  10.  
  11.  
  12.  
  13. -----------------------------[ C O N T E N T S ]-----------------------------
  14.  
  15.  
  16.         1.      Specification.
  17.         2.      System Requirements.
  18.         3.      Files Distributed.
  19.         4.      Revision History.
  20.         5.      Future Versions.
  21.  
  22.         6.      USER GUIDE
  23.             6.1     Start-Up Procedure.
  24.             6.2     Feeding Input to PRO-CR<tm>.
  25.             6.3     Font Selection.
  26.             6.4     Non HP ScanJet Users.
  27.             6.5     Output Text File.
  28.             6.6     Performance.
  29.             6.7     Theory of Operation.
  30.             6.8     Menus.
  31.             6.9     Learn Mode.
  32.             6.10    Edit Mode.
  33.             6.11    Error Messages.
  34.  
  35.         7.      Site Licenses.
  36.         8.      Comments to the Author.
  37.         9.      Association of Shareware Professionals.
  38.         10.     Miscellaneous.
  39.  
  40.  
  41.  
  42.  
  43. ----------------------------[ 1.  SPECIFICATION ]----------------------------
  44.  
  45.     *       Reads 8 to 30 point mono and proportional fonts.
  46.     *       Up to 200 words per minute.
  47.     *       Supports HP ScanJet or any scanner that supports TIFF files
  48.         (not suitable for hand-scanners).
  49.     *       Training and font editing supported with EGA or VGA adapter.
  50.     *       Real-time viewing of text during normal and training scan.
  51.     *       Continuous scanning if auto document feeder attached.
  52.     *       Upgrade to Version 2 when available.
  53.  
  54.  
  55.  
  56.  
  57. -------------------------[ 2.  SYSTEM REQUIREMENTS ]-------------------------
  58.  
  59. PRO-CR<tm> performs Optical Character Recognition on an IBM PC or compatible.
  60. The program will run on an XT or AT, however an AT is strongly recommended
  61. due to the highly cpu-intensive nature of the program.
  62.  
  63. A graphics adapter is not required for basic character recognition, but is
  64. needed for the training and font-edit functions.  If a graphics adapter is
  65. used, it should be EGA or VGA.  (CGA does not have the required resolution).
  66.  
  67. The minimum memory requirement is about 80Kb (512Kb is recommended), although
  68. the program adapts itself to use as much conventional memory as available.
  69. Version 1 does not support expanded or enhanced memory.  A temporary disk-file
  70. is used for any parts of the scanned image that will not fit into memory at
  71. once.
  72.  
  73.  
  74.  
  75.  
  76. --------------------------[ 4.  FILES DISTRIBUTED ]--------------------------
  77.  
  78.     OCR.EXE                 :       The PRO-CR<tm> program
  79.     README.DOC              :       Important information
  80.     HELP1.DOC               :       Text file used for online help
  81.     HELP2.DOC               :       Text file used for online help
  82.     HELP3.DOC               :       Text file used for online help
  83.     MANUAL.DOC              :       This file
  84.     COURIER.OCR             :       Font file
  85.     ROMAN.OCR               :       Font file
  86.     HELV.OCR                :       Font file
  87.     IMAGE.TIF               :       Example TIFF file for processing
  88.  
  89.     NOTE: The text in the IMAGE.TIF file is in Courier.
  90.  
  91.  
  92.  
  93.  
  94. --------------------------[ 5.  REVISION HISTORY ]---------------------------
  95.  
  96.     1.0     05/16/89        :       Baseline version.
  97.     1.01    05/18/89        :       Fixed character editing in font edit
  98.                     function, caused by bug in compiler's
  99.                     loop optimizer.
  100.     1.02    05/31/89        :       Don't reject TIFFs with no bits_per_
  101.                     sample tag.  Assume a value of 1.
  102.     1.03    06/19/89        :       Don't reject TIFFs with no resolution
  103.                     tags.
  104.     1.04    08/28/89        :       Fixed bug in learn-mode.
  105.     1.05    11/29/89        :       Fixed bug in Auto sheet feeder control.
  106.  
  107.  
  108.  
  109.  
  110. ----------------------------[ 6. FUTURE VERSIONS ]---------------------------
  111.  
  112. Version 2.0 is currently in progress.  Estimated shipping date is first quarter
  113. of 1990.  The following is a list of features expected to be included:
  114.  
  115.     *       Enhanced speed and recognition rate.
  116.     *       Font independance (just hit the start button).
  117.     *       Mouse support.  Selection of areas to be scanned.
  118.     *       Mixed text and graphics blocks for desktop publishers.
  119.     *       Direct support of Logitech hand-scanner.
  120.     *       Ability to handle compressed TIFFs, PCX and MSP formats.
  121.  
  122.  
  123.  
  124.  
  125. -------------------------[ 6.  U S E R    G U I D E ]------------------------
  126.  
  127.  
  128.  
  129.  
  130. -------------------------[ 6.1  START-UP PROCEDURE ]-------------------------
  131.  
  132. From the dos prompt, type:  ocr
  133.  
  134.  
  135.  
  136.  
  137. -----------------------[ 6.2  FEEDING INPUT TO PRO-CR ]----------------------
  138.  
  139.     There are 2 methods of supplying input to PRO-CR<tm>.
  140.     1.      Direct scanning from an HP ScanJet.
  141.     2.      Reading from a TIFF file produced by any other scanner.
  142.  
  143. Direct scanning allows you to scan a single page if you have a flat-bed
  144. scanner only or optionally scan multiple pages if you have an automatic
  145. document feeder attached.  Version 1 always scans entire pages.
  146.  
  147. PRO-CR<tm> recognizes both mono-spaced and proportionally spaced fonts.  It
  148. adjusts automatically to character size and will automatically switch fonts
  149. when more than one is selected.
  150.  
  151. PRO-CR<tm> is trainable.  A learning mode is provided to learn unrecognized
  152. shapes or new fonts.
  153.  
  154.  
  155.  
  156.  
  157. ---------------------------[ 6.3  FONT SELECTION ]---------------------------
  158.  
  159. PRO-CR<tm> provides a number of standard fonts for selection.  More than one
  160. font may be selected in cases where you are not sure what font is on the page
  161. to be processed, or if there is more than one font on the page.  For cases
  162. where only one font appears on the page to be scanned, selecting this font
  163. will generally give more accurate results and faster times than selecting all
  164. the fonts.  However, the penalty for selecting all fonts is not great and is
  165. probably the best thing to do if you are in any doubt.
  166.  
  167. If you are not sure what a particular font looks like, use the font editing
  168. feature to see the shapes of the default supplied fonts.  (See the chapter on
  169. the edit mode).
  170.  
  171.  
  172.  
  173.  
  174. ------------------------[ 6.4  NON HP SCANJET USERS ]------------------------
  175.  
  176. Compatibility with non-HP scanners is made possible through the use of TIFF
  177. (tag image file format) files.  Many scanners and desktop publishing programs
  178. use this standard file format.   A resolution of 300 dots per inch gives a
  179. good compromise between accuracy and processing time.  If the text you are
  180. scanning is large, over 12 points, you may wish to scan at a lower resolution,
  181. say 240 or 200 dpi to speed processing in PRO-CR<tm>. In general, though, the
  182. higher the resolution the better the accuracy.
  183.  
  184. When reading from a TIFF file, PRO-CR<tm> looks for the file IMAGE.TIF
  185.  
  186. Even if you do have an HP ScanJet you can still use it for cases when you do
  187. not wish to scan the whole page.  Use the scanning program that came with the
  188. scanner to scan the part of the page containing the text you wish to process.
  189.  
  190. Version 1 of PRO-CR<tm> does not read compressed TIFF files.
  191.  
  192.  
  193.  
  194.  
  195. --------------------------[ 6.5  OUTPUT TEXT FILE ]--------------------------
  196.  
  197. Whether scanning direct or reading from the TIFF file, all processed output
  198. is directed to a plain ASCII text file, default name TEXT.SAV.  Version 1
  199. does not support word processor attributes or file formats.  You may change
  200. the the name of the output file in the "run" menu.  Text is always appended
  201. to the file for each page scanned until you choose a new file name.
  202.  
  203.  
  204.  
  205.  
  206. -----------------------------[ 6.6  PERFORMANCE ]----------------------------
  207.  
  208.  
  209. 6.6.1   Font Size
  210. ~~~~~~~~~~~~~~~~~
  211. PRO-CR<tm> automatically adjusts itself to a range of point sizes within any
  212. document.  The range is approximately 8 to 30 points.  The low end depends
  213. on the quality of the document and the typeface used.  These figures assume
  214. the image was scanned at 300 dots per inch.  (The resolution used for the
  215. direct scanning mode).
  216.  
  217. Learning mode allows a total of 12 fonts, with up to 90 shapes in each font
  218. and up to 3 fonts selectable simultaneously in learning or non-learning mode.
  219.  
  220.  
  221. 6.6.2   Processing Speed
  222. ~~~~~~~~~~~~~~~~~~~~~~~~
  223. With one font selected, PRO-CR<tm> will process text at approximately 200
  224. words per minute on a 20MHz 386 PC.
  225.  
  226.  
  227. 6.6.3   Error Rate
  228. ~~~~~~~~~~~~~~~~~~
  229. The error rate is dependent on the quality of the text being processed and
  230. on the number of characters that "run together".  In general the mono-spaced
  231. fonts such as Courier are easiest and the Roman font is the hardest to
  232. accurately recognize.  For cases where characters run together, the learning
  233. mode can be used to help recognition.
  234.  
  235. With good quality type the error rate is approximately 95% to 99% for Courier
  236. and 90% to 95% for Roman and Helvetica.
  237.  
  238.  
  239.  
  240.  
  241. -------------------------[ 6.7  THEORY OF OPERATION ]------------------------
  242.  
  243.  
  244. 6.7.1   PRO-CR<tm> Uses Feature Extraction
  245. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
  246. With one proprietry global (topological) feature and two local features.  The
  247. local features are optimized for the three supplied fonts.  With all three
  248. fonts selected, good recognition is achieved on other non-stylized fonts via
  249. this combination of features.  PRO-CR<tm> also includes a large number of
  250. ad-hoc positional and context sensitive tests.
  251.  
  252.  
  253. 6.7.2   Single Character Errors
  254. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
  255. PRO-CR<tm> will not correctly recognize single characters 100% of the time.
  256. For every character guessed wrong, the reason is usually to be found on the
  257. document.  Broken characters, skewed lines, misplaced text, smudges, to name
  258. a few.  Sometimes it is just bad luck (for the technically minded, every
  259. signal processing system involves some noise.  In this case the noise is in
  260. the scanning conversion and is a function of the scan resolution.  Some
  261. characters look very much alike  (S vs 5, b vs h) and one pixel dropped from
  262. the wrong place and appearing in another place can cause mis-recognition.)
  263.  
  264.  
  265. 6.7.3   Run-Ons
  266. ~~~~~~~~~~~~~~~
  267. One of the biggest problems faced by Optical Character Recognizers are run-
  268. ons.  The ultimate run-on is human hand writing in which all the characters
  269. are joined together.  This kind of recognition is beyond the scope of most
  270. PC-based OCRs (including this one, except as follows:).
  271.  
  272. PRO-CR<tm> recognizes mono-spaced fonts such as Courier and proportional fonts
  273. such as Helvetica and Roman.  In tightly spaced proportional fonts many of the
  274. characters run into each other.  (This can also happen in badly spaced mono-
  275. fonts.)  The software only recognizes single objects and so gets very confused
  276. by characters joined together in this way.  It attempts to split up such
  277. run-ons in an attempt to recognize them as two characters but will many times
  278. still fail.  For cases where there are three characters it is almost certain
  279. to fail.  The run-ons are rather dependant on the particular printer which
  280. printed the page and for this reason a learning mode is provided.  This
  281. allows for learning unique shapes applicable to a particular document.  It also
  282. provides a mechanism to learn a completely new font.  Bear in mind that when
  283. learning a new font, best results are obtained with good clean type, 10 points
  284. or larger.  Don't try working with any kind of script font where all
  285. characters flow together, you won't get very far !
  286.  
  287.  
  288.  
  289.  
  290. -----------------------------[ 6.8  SELECT MODE ]----------------------------
  291.  
  292. The operator interface is implemented as a series of menu levels.  Completion
  293. of one takes you to the next, selecting QUIT takes you to the previous (or
  294. back to DOS if at the first menu).  The following is a list of menus and
  295. selections.
  296.  
  297. MENU 1.  (Select mode:)
  298. Select "Scan_mode" if you will be scanning direct or
  299. Select "File_mode" if you will be reading from your image.tif file.
  300.  
  301. MENU 2.  (Select font(s):)
  302. Select one or more fonts to be used when performing the ocr.  The selected fonts
  303. are indicated by a check mark.  Select the OK option to get to the run menu,
  304. menu 3.
  305.  
  306. Menus 2a and 2b are for use when learning or editing a font.  You can skip these
  307. menus during normal use and select OK to proceed to menu 3.
  308.  
  309. Menu 3.  (run)
  310. Select FILE NAME if you wish to change the name of the file which will be
  311. written to with the processed text.  The default file is "text.sav".  This is a
  312. plain ASCII text file which may be imported into any word processor or desktop
  313. publishing.  If more than one scan is done, new information is appended to this
  314. file until you select a new file name.
  315.  
  316. Select START for a single page scan or
  317.  
  318. Select AUTO FEED for a multi page scan.  This is only available when scanning
  319. directly, file mode will process everything in the file.  Also, an automatic
  320. document feeder must be present and ready for use.
  321.  
  322.  
  323.  
  324.  
  325. -----------------------------[ 6.9  LEARN MODE ]-----------------------------
  326.  
  327. MENU 2a. (Select font for learning:)
  328. Select the Learn option to select a font for learning or to add a brand new
  329. font for learning.  Only one font can be learnt and is indicated by an "L"
  330. instead of a check mark.  During the ocr you will be prompted for up to 3
  331. characters for any unrecognized characters.  If you are not sure what the un-
  332. recognized text is, press return.  It will be ignored.
  333.  
  334. Some points to note about learning mode is none of the 3 fonts include run-ons
  335. or, in other words, combinations of characters which are joined together.  The
  336. reason for this is that the shapes of the joined together characters are largely
  337. printer dependent and so, what might work well for one document, would not work
  338. for another.  In addition, the more shapes that are added to the font library,
  339. the more chance there is of choosing the wrong shape.
  340.  
  341. There are 2 uses for learning (training) mode:
  342. 1.      When there is a large amount of scanning to be done, for example a book,
  343. and it is worthwhile creating a special font just for this one document.  Do not
  344. try to learn to the 3 fonts supplied, they are write protected.  Instead, add a
  345. new font and learn to this.
  346.  
  347. 2.      Another use for the learning mode is to learn a new font from scratch.
  348. In this case best results will be obtained if you supply the font in the form
  349. of an alphabet, characters spaced well apart and in a large point size, say 14
  350. or more.  If necessary you can learn a completely new font just from the final
  351. copy to be processed but will not give the best results.  The program will
  352. prompt less and less as it proceeds to learn the alphabet.  It will often prompt
  353. for a character more than once. This is an indication of the variability of the
  354. characters scanned.
  355.  
  356. Hints for learning:
  357. The learning mode uses any characters you give it to try to match new
  358. characters.  In this way it should prompt you less and less as it learns the
  359. complete alphabet, eventually prompting only for joined or broken characters.
  360. However, you will find that on occasion it will prompt you for characters you
  361. have already entered.  This is due to the fact that there is a recognition
  362. threshold set which is a compromise between recognizing a character that has
  363. not been learnt yet and prompting too often for characters already learnt.
  364.  
  365.  
  366.  
  367.  
  368. ------------------------------[ 6.10  EDIT MODE ]-----------------------------
  369.  
  370. Use the edit mode to consolidate your learnt font, removing unwanted duplicate
  371. characters or runs and correcting any mistakes made when entering the string
  372. representation for the character shape.  Do not try to enter a string for
  373. shapes that you do not recognize yourself, just hit return to skip to the next
  374. character during a learning session.  Do not enter punctuation marks especially,
  375. these are handled with special algorithms.  Some characters, such as o, u, v, x
  376. etc. are ambiguous with regard to case when viewed out of context.  If you are
  377. unsure as to the case of a shape that the program prompts you with, either skip
  378. the character by entering return or simply enter the lower case version.  The
  379. program has special algorithms for adjusting the case of such ambiguous
  380. characters.
  381.  
  382. After a learning session, always run the program in non-learn mode using the new
  383. font to determine the results. You may use one font, for example one of the
  384. supplied fonts, while learning to a new font.
  385.  
  386. MENU 2b. (Select font to edit:)
  387. Select the EDIT option to select a font for editing.  Editing consists of
  388. deleting unwanted shapes from the font or changing the text which they
  389. represent.  Follow the directions on the edit screen.  Note that the default
  390. fonts supplied with PRO-CR<tm> are write protected so any attempt to learn to
  391. them or edit them will fail.
  392.  
  393.  
  394.  
  395.  
  396. ---------------------------[ 6.11  ERROR MESSAGES ]--------------------------
  397.  
  398. The following error codes may be seen, to do with TIFF files.
  399.  
  400.     1    :   Could not find the image.tif input file.
  401.     2    :   Non-Intel byte order.  The tif file is possibly a Mac file.
  402.     3    :   Wrong value for bits_per_sample tag.
  403.     4    :   Compressed TIFF file.  This version does not handle compressed.
  404.     5    :   Wrong value for photometric_interpretation tag.
  405.     6    :   Wrong value for fill_order tag.
  406.     7    :   Wrong picture orientation.
  407.     8    :   Wrong value for samples_per_pixel tag.
  408.     9    :   Wrong value for minimum_sample tag.
  409.     10   :   Wrong value for maximum_sample tag.
  410.     11   :   Wrong value for planar_configuration tag.
  411.     12   :   Missing bits_per_sample tag.
  412.     13   :   Missing image_width tag.
  413.     14   :   Missing image_length tag.
  414.     15   :   Missing image_pointer tag.
  415.     16   :   Missing X_resolution tag.
  416.     17   :   Missing Y_resolution tag.
  417.  
  418.  
  419.  
  420.  
  421. -----------------------------[ 7.  SITE LICENSE ]----------------------------
  422.  
  423. COMPANIES please note that only ONE USER at ONE LOCATION may use and operate
  424. PRO-CR<tm>.
  425.  
  426. Additional computers, users and locations should be registered separately,
  427. by volume, or by obtaining a site license.
  428.  
  429. DISCOUNT RATES are offered to companies registering for a site license or by
  430. volume.   Please write to Gray Design Associates, P.O. Box 333, Northboro,
  431. MA 01532, USA for a rate schedule.
  432.  
  433.  
  434.  
  435.  
  436. ------------------------[ 8.  COMMENTS TO THE AUTHOR ]-----------------------
  437.  
  438. Any feedback would be greatly appreciated.  Please direct any comments to
  439. author personally via mail to David P. Gray, Gray Design Associates,
  440. P.O. Box 333, Northboro, MA 01532, USA.
  441.  
  442.  
  443.  
  444.  
  445. ----------------[ 9.  ASSOCIATION OF SHAREWARE PROFESSIONALS ]---------------
  446.  
  447. This software is produced by David P. Gray who is a member of the Association
  448. of Shareware Professionals (ASP).  ASP wants to make sure that the shareware
  449. principle works for you.   If you are unable to resolve a shareware-related
  450. problem with an ASP member by contacting the member directly, ASP may be able
  451. to help.
  452.  
  453. The ASP Ombudsman can help you resolve a dispute or problem with an ASP member,
  454. but does not provide technical support for members' products.  Please write to
  455. the ASP Ombudsman at P.O. Box 5786, Bellevue, WA 98006, USA or send a CompuServe
  456. message via easyplex to ASP Ombudsman 70007,3536.
  457.  
  458.  
  459.  
  460.  
  461. ----------------------------[ 10.  MISCELLANEOUS ]---------------------------
  462.  
  463. HP and ScanJet are registered trade marks of Hewlett Packard.
  464.  
  465.  
  466.  
  467.  
  468. ----------------------------[ END OF MANUAL.DOC ]----------------------------
  469.